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摘要 在心 理学、 教育 学 和 组 织 行为 学 等 领域 的 研究 中 ， 研 究 者 常常 会 遇 到 存在 嵌 套 结构 的 
多 层 数 据 ， 如 被 试 可 能 拒 套 于 社区 、 班 级 、 诊 所 等 。 如 果 不 考 虑 数据 本 身 的 肉 套 结构 ， 可 能 
导致 一 些 统计 模型 违反 其 独立 性 假设 ， 从 而 对 模型 参数 的 估计 产生 较 大 的 人 和 偏差。 因此， 研究 
者 往往 需要 利用 多 层 模 型 解决 多 层 数据 中 非 独立 性 观测 可 能 带 来 的 问题 ， 但 由 于 客观 条 件 的 
限制 ， 实 际 研究 中 多 层 数 据 常常 出 现 水 平 1 或 水 平 2 样本 量 偏 小 的 情况 。 基 于 传统 频率 学 派 
的 极 大 似 然 估计 方法 (Maximum Likelihood, ML) 需 要 依赖 大 样本 ， 在 小 样本 下 容易 出 现 参数 估 
计 及 模型 收敛 等 方面 的 问题 。 贝 叶 斯 估计 在 小 样本 的 情况 下 往往 具有 更 大 的 优势 ， 但 与 此 同 
时 ， 也 更 容易 受到 先 验 信息 主观 设置 的 影响 。 为 了 探讨 贝 叶 斯 估计 中 错误 先 验 信 息 可 能 带 来 
的 负面 影响 ， 并 与 传统 方法 进行 对 比 ， 本 文 基于 多 层 模 型 ， 利 用 蒙特 卡 洛 模拟 ， 研 究 不 同 数 
据 类 型 ( 因 变 量 分 别 为 连续 正 态 分 布 数据 、 连 续 非 正 态 数据 与 二 分 变量 的 数据 )、 样 本 量 和 组 
内 相关 系数 (Intraclass Correlation Coefficient, ICC) 的 情况 下 ， 设 有 不 同 信 息 强度 和 偏差 程度 的 
先 验 信 息 对 贝 叶 斯 估计 的 影响 。 总 体 结果 显示 ， 贝 叶 斯 估计 中 均值 严重 偏离 真 值 的 先 验 分 布 
会 对 参数 估计 带 来 较 大 的 负面 影响 ， 特 别 是 在 ICC 较 大 ， 以 及 群 组 样本 量 和 先 验 分 布 方差 较 
小 的 情况 ， 且 因 变 量 为 非 正 态 分 布 或 二 分 变量 时 ， 错 误 先 验 信 息 的 负面 影响 更 为 明显 。 本 文 
对 多 层 模 型 中 错误 先 验 信息 对 贝 叶 斯 估计 的 影响 进行 研究 并 提出 建议 ， 和 希望 为 贝 叶 斯 估计 中 
先 验 分 布 的 设置 提供 一 定 的 理论 补充 及 实证 参考 。 
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Abstract 

In the research of psychology, education, and organizational behavior, researchers often 
encounter multilevel data with hierarchical structures (e.g., participants may cluster within 
communities, classes, or clinics). Ignoring the hierarchical structures of data may lead to a violation 
of the independence assumption of some models, resulting in biased parameter estimates. Therefore, 
researchers often need to conduct multilevel modeling to solve the statistical problems caused by 
non-independent observations. However, due to the limitation of objective conditions, in real studies, 
the sample sizes of level 1 and/or level 2 are often small in hierarchical data. Traditional frequentist- 
based maximum likelihood (ML) approach, which relies on large-sample theory, might lead to 
problems in parameter estimation and model convergence in multilevel modeling with small 
samples. In contrast, Bayesian approach is often more advantageous in small samples, but it is also 
more susceptible to the subjective specification of priors. 

To investigate the potentially detrimental effects of inaccurate prior information on Bayesian 
approaches and compare their performance to the traditional approaches, we conducted a series of 
simulations under the multilevel model framework with different dependent variable types (1.е., 
continuous normal, continuous non-normal, and binary dependent variables), sample sizes and 
intraclass correlation coefficients (ICCs). In sum, the results revealed the devastating impacts of 
inaccurate prior information on Bayesian estimation, especially in the cases of larger ICC, smaller 
level 2 sample size, and smaller prior variance. When the dependent variable was non-normal or 
binary, these negative effects were more obvious. The present study investigated the impacts of 
inaccurate prior information on Bayesian estimation and provided advice on the specification of 
priors. We hope that it could contribute to strengthening the theoretical and practical understanding 


of prior specifications. 
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在 心理 学 、 社 会 学 和 组 织 行为 学 等 领域 的 研究 中 ， 常 常会 涉及 到 存在 榜 套 结构 的 数据 ， 
也 称 为 多 层 数据 (Aryee et al., 2012; Holtmann et al., 2016; Hox et al., 2017)。 在 这 类 数据 中 ， 被 
试 可 能 来 自 不 同 的 社区 、 班 级 、 公 司 、 家 庭 等 ， 由 于 同一 群 组 内 的 个 体 更 倾向 于 得 到 一 致 的 
结果 ， 在 建 模 中 考虑 这 种 内 部 的 一 致 性 是 很 有 必要 的 (Sutton etal., 2013)。 在 多 层 数 据 中 ， 如 
果 不 考虑 数据 本 身 的 嵌 套 结构 ， 同 一 群 组 内 个 体 存 在 的 依赖 性 会 导致 一 些 统计 模型 (如 ， 多 
元 线性 回归 模型 ) 违 反 独 立 性 假设 (Cornfield, 1978; Rutterford et al., 2015; Van Breukelen & 
Candel, 2012)， 从 而 使 模型 参数 的 估计 产生 较 大 的 偏差 (McNeish, 2016)。 为 了 解决 由 群 组 内 
部 的 非 独 立 性 观测 所 引起 的 统计 方面 的 问题 ， 研 究 者 往往 需要 建立 多 层 模型 (Multilevel 


Dll 


us Modeling; Ryu, 2015). 

多 层 模型 的 传统 估计 方法 是 频率 学 派 的 方法 (主要 为 极 大 似 然 估计 , Maximum Likelihood, 
ML), 但 它 往往 需要 依赖 较 大 的 样本 量 ， 在 群 组 样本 量 较 小 时 容易 出 现 模 型 收敛 、 参 数 估计 
等 方面 的 问题 。 然而， 多 层 数 据 的 收集 往往 需要 更 大 的 经 济 成 本 、 更 高 的 收集 难度 ， 因 此 增 


大 群 组 样本 量 十 分 困难 (Campbell & Walters, 2014)。 特 别 是 在 群 组 随机 控制 实验 (cluster 


Randomised Controlled Trials, cPRCT) 中 , 往往 会 出 现 群 组 样本 量 过 小 的 问题 (McNeish, 2016)。 


N 事实 上 ,心理 学 研究 者 常常 需要 通过 设计 实验 研究 ,通过 实验 组 和 控制 组 的 对 比 ,探讨 其 实 


验 控制 或 干预 是 否 起 到 显著 的 效果 。 随 机 控制 实验 (Randomised Controlled Trials, RCT) 正 是 


实验 研究 设计 的 黄金 标准 (Campbell & Walters, 2014; Rutterford et al., 2015)， 但 许多 原因 驱使 


究 者 们 更 倾向 于 选择 对 群 组 而 不 是 个 体 为 单位 进行 实验 。 这 些 原因 可 能 包括 : 研究 受到 地 
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里 环 境 的 客观 限制 、 希 望 降低 * 干 预 污 染 ”(Treatment Contamination) ХІ (Campbell, 2019), 
以 及 希望 提高 干预 的 效率 、 便 利 性 、 参 与 者 的 依从 性 ， 减 少 伦理 方面 的 争议 等 (Rutterford et 


al.,2015)。 因 此 , 在 心理 学 、 社 会 学 和 教育 学 的 研究 中 , 特别 是 在 临床 心理 学 领域 , 这 种 CRCT 


的 实验 设计 都 是 十 分 常见 的 (Campbell, 2019; Ribeiro et al., 2018). 

考虑 到 传统 方法 在 小 样本 中 的 局 限 性 , 有 研究 者 提出 可 以 利用 贝 叶 斯 的 方法 来 解决 小 样 
本 可 能 带 来 的 问题 (Depaoli & уап de Schoot, 2017; Кадапе, 2015; McNeish, 2016; уап de Schoot 
et al., 2014)。 有 模拟 研究 表明 ， 在 多 层 模 型 中 ， 相 比 ML， 贝 叶 斯 方法 仅 需要 更 少 的 群 组 样 
本 量 就 可 以 得 到 较为 准确 的 参数 估计 (Hox et al., 2012)。 贝 叶 斯 方法 的 另 一 优势 在 于 它 能 结 


合 前 人 研究 的 先 验 信息 ， 提 高 参数 估计 的 准确 性 (Depaoli & Clifton, 2015; McNeish, 2016). 


然而 ， 由 于 实证 研究 和 理论 依据 的 缺乏 ， 先 验 分 布 的 设置 很 难 和 真实 情况 完全 一 致 ， 而 错误 


的 先 验 信息 可 能 对 模型 参数 的 估计 带 来 较 大 的 影响 。 
近年 来 , 一 些 学 者 开始 关注 错误 先 验 信息 对 特定 模型 可 能 造成 的 影响 , 如 多 质 多 法 模型 


(Multitrait-Multimethod, MTMM; Holtmann etal.,2016)、 潜 发 展 模型 (Depaoli, 2014; Shi & Tong, 


2017) 和 带 协 变量 的 CFA 模型 (Multiple Indicators, Multiple Causes Model, MIMIC; Finch & 


Miller, 2019) 等 。Holtmann 等 人 (2016) 的 研究 主要 基于 MTMM 的 框架 ,对 小 样本 条 件 下 不 同 
估计 方法 在 多 层 模 型 中 的 表现 进行 比较 。 其 研究 表明 ， 较 强 的 错误 先 验 信息 ( 即 先 验 分 布 的 
方差 较 小 ) 会 对 模型 参数 估计 带 来 毁灭 性 的 结果 , 但 对 参数 设 定 较 弱 ( 即 先 验 分 布 的 方差 较 大 ) 
的 错误 先 验 信息 时 , 其 估计 结果 可 能 优 于 无 信息 先 验 分 布 的 情况 。 然 而 , Holtmann 等 人 (2016) 
的 模型 中 只 考虑 了 两 因子 结构 的 测量 模型 ， 没 有 设置 协 变量 和 回归 路 径 ， 且 假设 认为 水 平 2 
的 样本 量 较 大 (50-200);， 但 在 一 些 多 层 模型 的 研究 中 (如 cRCT)， 群 组 (水 平 2) 样 本 量 一 般 小 
于 50， 群 组 内 部 (水 平 D) 的 被 试 数量 一 般 不 超过 100( 如 ，van der Putten et al., 2013; Ha et al., 


2017; Newton et al., 2018; Shen et al., 2019). 

考虑 到 cRCT 研究 的 普遍 性 和 目前 关于 错误 先 验 信息 的 影响 研究 的 局 限 , 本 研究 将 建立 
以 cRCT 为 背景 的 多 层 线 性 模型 (McNeish, 2016)， 利 用 蒙特 卡 洛 (Monte Carlo) 的 方法 进行 模 
拟 研 究 。 由 于 实证 研究 中 先 验 分 布 的 设置 存在 主观 性 ， 本 模拟 研究 将 关注 多 层 线性 模型 中 ， 
不 同 信息 强度 以 及 对 真实 值 不 同 偏差 程度 的 错误 先 验 信息 对 贝 叶 斯 估计 带 来 的 影响 , 以 考察 
贝 叶 斯 估计 对 先 验 分 布设 置 的 容错 性 ; 同时 ， 对 贝 叶 斯 和 传统 方法 (ML) 的 表现 进行 对 比 ， 以 
帮助 研究 者 在 实际 研究 中 更 好 地 选择 合适 的 估计 方法 ,希望 可 以 为 小 样本 情况 下 估计 方法 的 
选择 和 贝 叶 斯 方法 中 先 验 分 布 的 设置 提供 借鉴 和 参考 。 


© 2 多 层 线性 模型 和 贝 叶 斯 估计 


2.1 多 层 线性 模型 
多 层 模型 常用 来 对 存在 嵌 套 结构 的 数据 进行 分 析 , 以 解决 由 群 组 内 部 的 非 独 立 性 观测 所 
引起 的 统计 方面 的 问题 (Ryu, 2015)。 它 可 以 将 变量 的 变异 来 源 分 解 为 不 同 的 水 平 (如 , 个 体 水 
平 、 群 组 水 平 以 及 其 他 更 高 的 水 平 )， 这 些 变异 可 以 被 不 同 水 平 的 变量 共同 解释 (Heck & 
Thomas, 2015)， 因 此 能 灵活 考虑 不 同 水 平 变量 之 间 的 相互 作用 。 
考虑 到 研究 结果 的 普 适 性 ,本 研究 将 主要 关注 应 用 最 为 广泛 的 多 层 线性 模型 ， 并 考虑 不 
同 群 组 间 的 随机 截 距 和 随机 斜率 效应 。 这 一 模型 也 是 标准 CRCT 中 的 模型 (McNeish, 2016). 


模型 公式 和 路 径 图 如 下 (McNeish, 2016): 


Yij = Boj + BijXiij + 2; Ху “Вз) Хау + ei (1) 
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Boj = boo + boi Wij + Uoj 
Pij = bio + by Wij + щу 


Ва) = Боо + by Wij + Up; 


Взу = bao + ba1Wij + Us; 


图 1 多 层 线性 模型 


(2) 
(3) 
(4) 
(5) 


Жән, WKF 2 的 自 变 量 ， 在 cRCT 中 一 般 为 二 分 变量 ， 表 示 实 验 组 或 者 控制 组 ，Xaij- 


Xsij 均 为 水 平 1 的 自 变量 ， 表 示 被 试 的 性 列 、 年 龄 、 变 量 前 测 数据 等 。Boj 为 随机 稚 距 ，BJj- 


Bs 为 随机 斜率 ， 下 标 /表示 这 些 截 距 和 斜率 项 在 不 同 群 组 间 可 能 存在 差异 。uoj-usj 分 别 对 应 


为 poj-Bsj 的 残 差 项 ， 服 从 均值 为 0， 方 差 协 方差 矩阵 为 9 的 多 元 正 态 分 布 。 

传统 上 ， 多 层 模型 常常 利用 频率 学 派 的 方法 对 未 知 参数 进行 估计 (Depaoli & Clifton, 
2015)。 然 而 ， 在 ML 的 理论 框架 下 ， 参 数 的 无 偏 估计 需要 满足 数据 渐 近 符合 正 态 分 布 的 前 
提 ， 这 对 样本 量 要 求 较 高 (McNeish, 2016)。 在 多 层 模型 的 分 析 中 ， 对 群 组 水 平 (Level 2) 的 参 


HH 
数 进行 估计 时 还 需 


将 群 组 视 为 整体 , 因此 ML 方法 往往 还 要 求 数据 有 足够 的 群 组 数目 ， 从 而 


才能 满足 渐 近 理论 的 假设 (Asparouhov & Muthén, 2010)。 一 般 来 说 ， 随 着 多 层 模 型 中 群 组 样 
本 量 的 增多 ， 整 体 数 据 更 趋向 于 正 态 分 布 (Rutterford et al., 2015)， 因 此 相对 于 组 内 样本 量 ， 
增 大 群 组 的 数量 能 更 有 效 地 增 大 实验 的 检验 力 (Ribeiro et al., 2018)。 较 多 研究 指出 ，ML 方 


法 在 总 体 样本 量 较 小 时 的 多 层 模 型 中 表现 较为 糟糕 (MecNeish & Stapleton, 


2014)， 特 别 是 在 水 


平 1 和 水 平 2 样本 量 均 较 小 的 情况 下 ， 传 统 ML 方法 在 多 层 模 型 中 往生 


会 遇 到 难以 收敛 的 


问题 (Depaoli & Clifton, 2015; Hox & Maas, 2001; Hox et al., 2010; McNeish, 


2016; Schoeneberger, 


2015), 而 且 可 能 会 出 现 参数 估计 结果 不 可 靠 、 不 稳定 的 情况 (Asparouhov & Muthén, 2010; Hox 


& Maas, 2001; McNeish, 2016). 


2.2 贝 叶 斯 估计 


为 了 解决 在 群 组 样本 量 较 小 的 多 层 模型 中 传统 的 频率 学 派 方 法 在 模型 收敛 、 参 数 估计 等 
方面 的 问题 , 研究 者 可 以 利用 贝 叶 斯 的 方法 来 对 模型 进行 估计 (Depaoli & van de Schoot, 2017; 
Kadane, 2015; McNeish, 2016; van de Schoot et al., 2014)。 一 般 来 说 ， 在 小 样本 情况 下 ， 贝 叶 
斯 估计 在 模型 收 僵 、 参 数 估计 等 方面 的 表现 比 传统 方法 更 优 (Lee & Song, 2004; Muthén & 


Asparouhov, 2012), 特别 是 多 层 模型 中 群 组 样本 量 较 小 的 情况 下 (Asparouhov & Muthén, 2010; 


Hox et al., 2012; Muthén & Asparouhov, 2012)。 简 单 来 说 ， 贝 叶 斯 方法 认为 未 知 参数 是 随机 变 
量 , 可 以 利用 先 验 信息 和 似 然 函 数 得 到 的 后 验 分 布 来 反映 参数 在 不 同 取 值 上 的 可 能 性 (Lynch, 
2007)。 它 和 传统 频率 学 派 的 基础 理论 框架 不 同 ， 不 依赖 于 频率 学 派 的 大 样本 渐 近 理论 
(McNeish, 2016)。 在 贝 叶 斯 估计 中 ， 参 数 取 值 概率 的 后 验 分 布 可 以 表示 为 (Lynch, 2007): 

ply) ос p(y|0)p(0) (6) 
其 中 ，y 表 示 观 测 变量 向 量 ，6 对 应 表示 未 知 参数 向 量 。p(9|y) 表 示 取 值 概率 的 后 验 分 布 ， 它 
同时 取决 于 先 验 信息 p(9) 和 数据 似 然 函 数 p(y|9)(Lynch, 2007)。 一 般 来 说 , 当 样 本 量 较 大 时 ， 
后 验 分 布 主要 取决 于 似 然 函数 , 而 随 着 样本 量 的 减 小 , 先 验 信息 对 参数 后 验 估计 的 影响 也 逐 
渐 增 大 。 因 此 , 在 小 样本 的 情况 下 ,对 于 先 验 分 布 的 设置 需要 更 加 慎重 (Holtmann et al., 2016; 
McNeish, 2016). 

贝 叶 斯 方法 不 需要 对 参数 的 抽样 分 布 做 出 假设 , 也 不 需要 通过 复杂 的 计算 来 得 到 参数 估 
计 的 标准 误 ， 所 以 能 很 好 地 克服 传统 方法 在 小 样本 情况 模型 难以 达到 收敛 的 问题 (Depaoli & 
Clifton, 2015; Levy & Choi, 2013)。 贝 叶 斯 方法 的 另 一 优势 在 于 它 能 结合 前 人 研究 的 先 验 信 
息 ， 提 高 参数 估计 的 准确 性 (Depaoli & Clifton, 2015; McNeish, 2016)。 然 而 ， 先 验 分 布 的 设置 
存在 一 定 的 主观 性 , 且 由 于 实证 研究 和 理论 依据 的 缺乏 , 很 可 能 出 现 先 验 分 布 的 设置 和 真实 
情况 不 一 致 的 情况 ， 即 可 能 出 现 错误 先 验 信 息 的 情况 。 

为 了 探究 贝 叶 斯 估计 下 ， 不 同 信息 强度 的 先 验 分 布 ( 即 先 验 分 布 方差 大 小 的 不 同 ) 可 能 带 
来 的 影响 ， 一 些 研究 者 对 不 同情 境 下 的 模型 进行 了 模拟 研究 (Depaoli & Clifton, 2015)。 如 ， 
McNeish(2016) 曾 以 cRCT 为 研究 背景 ， 建 立 多 层 模 型 ， 利 用 不 同 的 估计 方法 对 模型 参数 进 
行 估计 和 比较 ， 包 括 传统 频率 学 派 的 ML、 限 制 性 极 大 似 然 估 计 (Restricted Maximum 
Likelihood, REML) 和 贝 叶 斯 估计 ; 并 在 贝 叶 斯 方法 下 ， 比 较 先 验 分 布 的 不 同 信息 强度 对 参数 
估计 的 影响 。 其 模拟 研究 结果 表明 , 先 验 分 布 中 不 同 信息 强度 的 设置 对 模型 参数 估计 的 影响 
较 大 , 特别 是 在 总 体 样 本 量 较 小 、 因 变量 为 分 类 数据 的 情况 下 (Lynch, 2007; McNeish, 2016). 
然而 ， 和 许多 模拟 研究 一 样 ，McNeish(2016) 对 于 先 验 分 布 的 影响 研究 ， 是 基于 其 先 验 分 布 
能 提供 正确 先 验 的 假设 , 而 没有 考虑 错误 先 验 信息 可 能 带 来 的 影响 。 一般 来 说 , 较 强 的 错误 
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先 验 信 息 会 对 模型 参数 估计 带 来 毁灭 性 的 结果 , 特别 是 在 样本 量 较 小 的 情况 下 。 但 也 有 研究 
指出 ， 对 参数 设 定 较 弱 ( 即 先 验 分 布 的 方差 较 大 ) 的 错误 先 验 信 息 时 ， 其 估计 结果 可 能 优 于 无 
信息 先 验 分 布 的 情况 (Holtmann et al., 2016)。 目 前 ， 对 于 贝 叶 斯 估计 中 错误 先 验 信息 的 影响 
仍 有 许多 不 明确 的 地 方 ， 需 要 更 多 相关 研究 来 加 深 研 究 者 们 的 认识 (Finch % Miller, 2019; 
Holtmann etal.,2016)。 因 此 ， 本 文 将 基于 应 用 较为 广泛 的 多 层 线性 模型 ， 展 开 一 系列 模拟 研 
究 ， 以 探究 不 同 数据 条 件 下 错误 先 验 信息 对 贝 叶 斯 估计 的 影响 。 


3 模拟 研究 


3.1 研究 设计 
基于 图 1 的 多 层 线性 模型 1， 本 研究 考虑 以 下 因素 的 影响 : 不 同样 本 量 (包括 水 平 1 和 水 
^E 2 样本 量 )、 组 内 相关 系数 (Intraclass Correlation Coefficient, ICC) 以 及 估计 方法 。 本 文 利用 
R 软件 进行 模拟 数据 的 生成 , 并 利用 Mplus 8.0(Muthén & Muthén, 1998-2017) 进 行 模型 分 析 。 
为 简化 模型 ， 本 研究 中 因 变 量 服从 连续 正 态 分 布 。 

样本 量 

以 “cluster Randomised Controlled Trials” 和 “multilevel” 为 关键 词 ， 在 Web of Science 
上 对 近 5 年 (2015-2019 年 ) 的 核心 期 刊 论文 进行 检索 及 初步 箭 选 ， 得 到 95 篇 相关 文献 。 利 用 
摘要 、 全 文 获取 等 方法 , 对 有 报告 样本 量 的 文献 中 的 群 组 数量 和 群 组 内 被 试 的 平均 数量 进行 
编码 ， 得 到 其 样本 量 设置 情况 。 如 图 2 所 示 ， 近 5 年 cRCT 研究 中 的 群 组 数量 主要 集中 于 
10-40 之 间 ， 而 群 组 内 被 试 的 平均 数量 大 多 小 于 100。 因 此 ， 结 合 文献 检索 、 编 码 的 结果 ， 
€ 以 及 Depaoli 和 Clifton(2015) 的 建议 ， 本 研究 中 水 平 2 样本 量 分 别 设 为 20，30，40，50; Ж 

平 1 的 样本 量 分 别 为 : 30，60，150。 


fiti 


! Rep, Xs EMER, XS. Хау. WUE ADEE, ZAR IHESU oo - bao YE CIR SY 
30, 2.3, -0.25, -0.75; Ил) 对 各 斜率 5 的 作用 (boi-bsi) 真 值 分 别 设 为 1.5，0.12，-0.05，-0.75。 
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2 2015-2019 年 cRCT 研究 中 的 样本 量 统计 


ICC 

在 多 层 模 型 的 研究 中 ， 研 究 者 往往 还 会 关注 不 同 水 平 的 ICC 可 能 对 参数 估计 造成 的 影 
响 。ICC 表示 变量 的 总 变异 可 以 被 水 平 2 的 变异 解释 的 比例 ， 其 计算 公式 为 ICC = o$/(08 + 
ac‰)， 其 中 oaw 和 08 分 别 表示 水 平 1 和 水 平 2 的 方差 。ICC 越 大 ， 变 量 在 组 间 的 差异 相对 于 
组 内 差异 越 大 。 多 项 前 人 研究 表明 , 当 ICC 较 小 时 , 传统 频率 学 派 的 方法 可 能 出 现 参数 估计 
以 及 模型 收敛 方面 的 问题 (Hox % Maas, 2001; Preacher et al., 2011; Koch et al, 2015)， 而 贝 叶 
斯 估计 的 方法 可 能 可 以 在 ICC 较 小 时 仍 能 得 到 准确 的 参数 估计 (Hox et al., 2012; Muthén & 
Asparouhov, 2012)。 有 模拟 研究 的 结果 表明 ，ICC 越 大 ， 无 信息 先 验 的 贝 叶 斯 方法 对 水 平 2 
参数 的 估计 偏差 可 能 反而 越 大 (Depaoli & Clifton, 2015)。 另 外 ， 在 多 层 MIMIC 中 ， 对 于 水 平 
2 参数 的 估计 偏差 会 随 着 ICC 的 增 大 而 增 大 , 检验 力 随 着 ICC 的 增 大 而 减 小 (Cao et al., 2019; 
Finch & French, 2011). Fang 等 人 (2019) 指 出 ， 未 来 研究 可 以 进一步 探讨 在 更 多 多 层 模 型 中 ， 
ICC 对 于 贝 叶 斯 估计 及 其 他 估计 方法 表现 的 影响 。 

一 般 来 说 ， 当 ICC 20.059 时 ， 需 要 考虑 被 试 间 的 差异 ， 使 用 多 层 模 型 对 数据 进行 分 析 
(Cohen, 1988)。 前 人 关于 多 层 模型 的 模拟 研究 中 ,主要 关注 的 ICC 介 于 0.05 到 0.2 之 间 (e.g.， 
Depaoli & Clifton, 2015; Hox et al., 2010; Liidtke et al., 2011; Preacher et al., 2011)， 因 此 本 研究 
中 的 ICC 也 将 分 为 0.05、0.1 和 0.2 三 个 水 平 。 为 了 使 得 ICC 的 水 平分 别 为 0.05、0.1 和 0.2, 
模型 中 各 个 水 平 变量 的 方差 和 残 差 方差 随 之 发 生变 化 (Depaoli & Clifton, 2015). 

估计 方法 


chinaXiv:202010.00073v1 


模拟 研究 使 用 的 估计 方法 为 传统 频率 学 派 的 ML2? 估 计 以 及 贝 叶 斯 方法 。 贝 叶 斯 方法 分 
为 无 信息 先 验 和 有 信息 先 验 的 情况 。 在 有 信息 先 验 的 贝 叶 斯 估计 中 , 针对 回归 系数 设置 先 验 
分 布 Му, 02). 分 5 个 水 平 ， 即 无 偏 ， 向 左 / 右 偏 移 回 归 系 数 真 值 1 个 标准 差 (Standard 
Deviation, SD); UK IH] c tite FUB. 350.02 4) 3 个 水 平 , 分 别 为 对 应 回归 系数 真 值 的 10%、 
20%. 50% (Depaoli, 2014)。 以 boi( 真 值 为 1.5) 为 例 ， 其 15 种 不 同 偏差 程度 及 信息 强度 的 先 
验 分 布设 置 如 图 3 所 示 。 加 上 无 信息 先 验 的 情况 (按照 Mplus 默认 的 设置 ， 回 归 系 数 的 先 验 
分 布 均值 为 0， 方差 为 无 穷 大 )， 贝 叶 斯 方法 有 1+5*3=16 种 先 验 分 布 的 设置 。 再 加 上 传统 的 
估计 方法 (ML)， 需 要 进行 17 种 估计 方法 的 比较 。 


弱 信息 先 验 分 布 : 02=1.5*50% 
-1SD 0SD +1SD 
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图 3 不 同 偏差 程度 及 信息 强度 的 先 验 分 布设 置 (以 bos 为 例 ) 
综 上 ， 本 研究 包括 3*4*3*17=612 种 模拟 条 件 的 组 合 。 为 了 减少 模型 估计 过 程 中 的 偶然 
性 因素 带 来 的 偏差 ， 本 研究 在 每 个 条 件 下 均 生 成 100 个 重复 样本 进行 估计 。 


3.2 结果 评估 指标 
为 了 对 不 同 估计 方法 的 参数 估计 表现 进行 评估 , 本 文 将 首先 对 各 条 件 下 的 收敛 率 进 行 检 
查 ,再 根据 达到 收敛 的 结果 ， 对 5 个 方面 指标 进行 整理 、 对 比 和 分 析 。 结 果 评 估 的 指标 包括 


系数 估计 的 相对 偏差 (Relative Bias)、 标 准 误 比 例 、 均 方 误差 (Mean Square Error). 95% E fri [X 


间 (Confidence Interval) 或 可 信 区 间 (Credible Interval) #2 15 (95% СІ 覆盖 率 ) 和 检验 力 (Powen。 


2 Mplus 默认 对 多 层 模型 采用 稳健 极 大 似 然 估 计 (Robust Maximum Likelihood Estimator, MLR) 


9 


多 层 线 性 模型 较为 简单 ， 因 此 在 本 研究 考虑 的 情况 中 ,模型 均 能 得 到 收敛 。 本 文 只 针对 
回归 系数 进行 不 同 先 验 分 布 的 设置 , 因此 同样 只 对 回归 系数 的 结果 进行 评估 和 分 析 。 为 了 探 
究 不 同 结果 指标 受到 不 同 因素 的 影响 程度 及 其 交互 作用 , 本 文 还 对 每 个 重复 样本 中 各 回归 系 
数 的 结果 评估 指标 进行 方差 分 析 ( 其 中 ， 考 虑 到 各 参数 相对 偏差 可 能 出 现 正 负 抵消 的 情况 ， 
在 方差 分 析 中 对 相对 偏差 取 绝 对 值 后 再 进行 分 析 )。 如 表 1 所 示 ， 总 体 来 说 ， 各 结果 评估 指 
标 在 不 同 程度 上 受到 ICC、 水 平 1 及 水 平 2 样本 量 、 先 验 分 布 的 方差 大 小 、 均 值 偏 移 真 值 的 
程度 的 影响 ， 且 不 同 因素 之 间 可 能 相互 影响 。 

在 cRCT 中 , 研究 者 往往 更 关注 水 平 2 的 自 变 量 Wi 对 因 变 量 的 影响 bo1。 因 此 , 为 了 使 
得 结果 的 呈现 和 分 析 更 清晰 ， 以 下 结果 均 将 以 bo1 为 例 ， 分 别 对 其 参数 估计 偏差 、 标 准 误 比 
例 等 评估 指标 进行 分 析 。 

相对 偏差 

相对 偏差 指 模 型 达到 收敛 的 次 数 中 , 模型 参数 估计 得 到 的 均值 相对 于 参数 的 真 值 的 偏差， 
其 计算 公式 为 Relative Bias = (6 一 9)/9。 其 中 , 6 表示 模型 达到 收敛 的 次 数 中 ,参数 的 平均 
估计 值 ，6 表 示 对 应 的 参数 真 值 。 相 对 偏差 在 土 10% 以 内 是 可 以 接受 的 ， 可 以 视 为 无 偏 的 估 
计 (Flora & Curran, 2004). 

总 体 来 说 ， 各 参数 估计 的 相对 偏差 变化 呈现 的 规律 大 体 一 致 。 以 poi fh TE EY ES Oh 25 2s 
> RIPE 4), ML 和 无 信息 先 验 的 贝 叶 斯 估计 表现 较为 接近 ， 均 不 容易 受到 不 同 ICC 水 平 
>< 的 影响 。 对 于 有 信息 先 验 的 贝 叶 斯 方法 ， 其 参数 估计 的 偏差 会 受到 水 平 2 样本 量 、 先 验 分 布 
- 的 方差 大 小 以 及 其 均值 偏 移 真 值 的 程度 的 共同 影响 ， 而 水 平 1 样本 量 的 对 相对 偏差 的 影响 
并 不 明显 。 一 般 来 说 ， 随 着 水 平 2 样本 量 和 先 验 分 布 方差 的 增 大 ， 先 验 分 布 均值 对 真 值 的 仿 

移 程 度 对 相对 偏差 的 影响 也 逐渐 减 小 。 对 于 cRCT 研究 中 最 受 关注 的 实验 干预 对 因 变量 产生 
的 效应 (bo1)， 其 先 验 设置 中 的 错误 信息 对 相对 偏差 的 负面 影响 会 随 着 ICC 的 减 小 而 逐渐 减 
小 。 但 ICC 的 这 种 影响 趋势 在 其 他 回归 系数 中 并 不 明显 。 

标准 误 比例 

标准 误 比例 是 模型 达到 收敛 的 次 数 中 , 标准 误 估 计 的 平均 值 (Standard Error, SE) 和 SD 的 
比例 。 标 准 误 估计 越 准确 ， 二 者 的 比例 应 越 趋 近 于 1。 一 般 来 说 ， 标 准 误 比例 应 介 于 0.9 和 
1.1 之 间 (Cham et al., 2012)。 

bo 标准 误 比 例 的 结果 如 图 5 所 示 。 总 体 来 看 ， 有 信息 先 验 的 贝 叶 斯 估计 往往 高 估 标 准 
误 比 例 的 大 小 ， 且 远 远 超过 可 以 被 接受 的 范围 。 随 着 先 验 分 布 方差 的 增 大 ， 先 验 信息 的 强度 
逐渐 减弱 , 标准 误 比 例 也 逐渐 减 小 并 向 1 靠拢 。 水 平 2 样本 量 的 增 大 也 能 较 大 程度 地 减 小 有 
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时 ， 其 标准 误 比 例 往 往 高 于 同等 条 件 下 正确 先 验 信息 的 情况 。 随 着 ICC 的 减 小 , 错误 先 验 信 
县 对 标准 误 比 例 的 影响 也 逐渐 减 小 。 

均 方 误差 

均 方 误差 是 模型 达到 收敛 的 次 数 中 ， 参 数 估 计 的 误差 的 均值 。 其 计算 公式 为 
Mean Square Error = XÂ; — 06)? / 收敛 次 数 。 其 中 ， 人 表示 模型 达到 收敛 时 ， 第 i 个 重复 
样本 得 到 的 参数 估计 值 ，0; 表 示 对 应 的 参数 真 值 。 均 方 误差 越 小 ， 参 数 估计 越 准确 。 

如 图 6 所 示 ， 在 小 样本 的 情况 下 ，ML 和 无 信息 先 验 的 贝 叶 斯 估计 更 倾向 于 得 到 的 较 大 
的 均 方 误差 。 正 确 先 验 信息 的 贝 叶 斯 估计 在 均 方 误差 方面 表现 最 优 ,而 错误 先 验 信息 会 大 大 
增加 贝 叶 斯 方法 对 参数 估计 的 均 方 误差 。 随 着 ICC 的 减 小 以 及 水 平 1、 水 平 2 样本 量 的 增 
大 ， 先 验 分 布 均值 偏 移 真 值 的 程度 对 均 方 误差 影响 也 逐渐 减 小 。 相 比 水 平 2 样本 量 的 大 小 ， 
水 平 1 样本 量 对 于 均 方 误差 的 影响 较 弱 。 随 着 水 平 2 样本 量 的 增 大 , ICC 的 增 大 对 于 错误 先 
验 信息 负面 影响 的 增强 作用 也 逐渐 减 小 。 另外， 先 验 分 布 的 方差 越 大 , 错误 先 验 信息 对 均 方 
误差 带 来 的 负面 影响 也 越 弱 。 

LE ES 

在 模型 收敛 的 重复 样本 中 ， 参 数 真 值 落 在 95% 置 信 区 间或 可 信 区 间 的 概率 即 为 95% CI 
履 盖 率 。 简 单 来 说 ， 频 率 学 派 下 通过 计算 得 到 的 置信 区 间 需 要 依赖 渐进 理论 的 前 提 假 设 ， 而 
贝 叶 斯 学 派 下 的 可 信 区 间 直 接 根据 参数 后 验 分 布 的 百 分 位 值得 到 , 因此 不 需要 假设 参数 渐进 
服从 某 一 分 布 。 若 区 间 估 计 准 确 ，95% 区 间 覆 盖 率 应 接近 0.95。 一 般 来 说 ，95% CI 覆盖 率 大 
于 0.9 是 可 以 被 接受 的 (Collins et al., 2001). 

如 图 7 所 示 ， 总 体 来 说 ， 随 着 水 平 2 样本 量 的 增 大 ， 参 数 估计 的 95% СІ 履 盖 率 逐 渐 增 
大 , 但 水 平 1 样本 量 的 增 大 对 于 95% CI 覆盖 率 的 影响 并 不 明显 。 对 于 有 信息 先 验 的 贝 叶 斯 
估计 ， 一 般 来 说 ， 先 验 分 布 均值 偏离 真 值 的 程度 越 大 ，95% CI 覆盖 率 越 低 。 当 先 验 分 布 的 
均值 偏离 参数 真 值 的 程度 不 超过 1 个 标准 差 时 , 参数 估计 的 95% CI 覆盖 率 均 处 于 可 以 被 接 
受 的 范围 (大 于 90%); 而 先 验 分 布 的 均值 偏离 参数 真 值 的 程度 较 大 时 (偏离 真 值 3 个 标准 差 )， 
参数 估计 的 95% CI 覆盖 率 会 受到 较 大 程度 的 影响 。 随 着 ТСС 的 减 小 以 及 水 平 2 样本 量 的 
兽 大 ， 错 误 先 验 信息 对 95% CI 履 盖 率 的 负面 影响 逐渐 减 小 ; 然而 ，ICC 的 这 种 影响 趋势 在 
他 回归 系数 中 并 不 明显 。 
检验 力 
检验 力 指 零 假设 为 假 的 情况 下 , 假设 检验 成 功 地 拒绝 零 假 设 的 概率 。 即 当 参 数 的 真 值 不 
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为 0 的 情况 下 ， 在 模型 达到 收敛 的 次 数 中 ， 该 参数 估计 得 到 的 959% 80А X IRI (Confidence 
Interval) 或 可 信 区 间 (Credible IntervaD) 不 包括 0 的 比例 。 检 验 力 大 于 0.8 一 般 是 可 以 被 接受 的 


(Cohen, 1988; Muthén % Muthén, 2002). 

如 图 8 所 示 ， 当 样本 量 较 小 、ICC 较 大 时 ，ML 和 无 信息 先 验 的 贝 叶 斯 估计 对 参数 的 检 
验 力 较 低 。 而 对 于 提供 正确 先 验 信息 的 贝 叶 斯 估计 ， 即 使 在 样本 量 较 小 的 情况 下 ， 其 参数 估 
计 的 检验 力 仍 处 于 可 以 被 接受 的 范围 (检验 力 高 于 0.8)。 低 估 参 数 效 应 的 错误 先 验 信息 往往 
降低 参数 估计 的 检验 力 , 高 估 参 数 效应 的 错误 先 验 信息 对 应 的 检验 力也 较 高 , 但 同时 可 能 
致 较 高 的 一 类 错误 率 。 随 着 水 平 2 样本 量 的 增 大 以 及 ICC 的 减 小 ， 错 误 先 验 信息 对 检验 力 
的 影响 也 逐渐 减 小 。 

小 结 


总 的 来 看 ， 对 贝 叶 斯 估计 设置 正确 的 有 信息 先 验 时 ， 其 各 项 评估 指标 的 表现 最 优 ， 特 别 
是 参数 估计 的 偏差 方面 。 无 信息 先 验 的 贝 叶 斯 估计 和 ML 方法 在 参数 估计 上 的 表现 呈现 出 
较为 相似 的 规律 ， 其 在 均 方 误差 和 检验 力 方面 表现 不 佳 ,特别 是 在 样本 量 较 小 、ICC 较 大 的 
情况 下 。 而 先 验 分 布 均值 对 参数 真 值 存在 偏离 时 ， 较 大 的 ICC 和 较 小 的 水 平 2 样本 量 均 会 
增 大 错误 先 验 信息 对 参数 估计 带 来 的 负面 影响 。 先 验 分 布 的 信息 强度 越 强 , 其 错误 先 验 信息 
对 参数 估计 的 影响 也 越 大 。 


ІНІ 
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Ж 1 方差 分 析 partial v? 结果 


估计 偏差 标准 误 比例 均 方 误差 95% CI 覆盖 率 PEYIA] 

a ML BD INF ML BD INF ML BD INF ML BD INF ML BD INF 
ICC 0.004 0.005 0.001 0.016 0.022 0.024 0.014 0.013 0.135 0.002 0.001 0.008 0.000 0.007 0.001 
L2 0.092 0.093 0.127 0.028 0.152 0.925 0.160 0.159 0.153 0.004 0.002 0.036 0.124 0.284 0.067 
L1 0.036 0.037 0.020 0.007 0.010 0.690 0.064 0.064 0.014 0.001 0.002 0.004 0.065 0.085 0.019 
mag - - 0.891 - - 0.496 - - 0.540 - - 0.765 - - 0.205 
strength - - 0.386 - - 0.956 - - 0.058 - - 0.077 - - 0.108 
ICC * L2 0.001 0.001 0.000 0.015 0.019 0.103 0.002 0.002 0.015 0.002 0.001 0.000 0.006 0.010 0.002 
ICC * L1 0.001 0.001 0.000 0.009 0.011 0.136 0.001 0.001 0.001 0.002 0.001 0.000 0.001 0.002 0.000 
ICC * mag - - 0.000 - - 0.002 - - 0.169 - - 0.016 - - 0.006 
ICC * strength - - 0.000 - - 0.000 - - 0.008 - - 0.001 - - 0.000 
L2*LI 0.001 0.001 0.000 0.027 0.042 0.462 0.007 0.007 0.001 0.001 0.002 0.000 0.003 0.004 0.001 
L2 * mag - - 0.167 - - 0.256 - - 0.185 - - 0.095 - - 0.001 
L2 * strength - - 0.013 - - 0.471 - - 0.010 - - 0.002 - - 0.006 
L1 * mag - - 0.024 - - 0.007 - - 0.010 - - 0.008 - - 0.000 
L1 * strength - - 0.001 - - 0.187 - - 0.001 - - 0.000 - - 0.002 
mag * strength - - 0.070 - - 0.083 - - 0.001 - - 0.209 - - 0.013 
ICC * L2 * L1 0.002 0.002 0.000 0.031 0.030 0.098 0.002 0.002 0.000 0.002 0.004 0.001 0.004 0.004 0.001 
ICC * L2 * mag - - 0.000 - - 0.007 - - 0.027 - - 0.001 - - 0.001 
ICC * L2 * strength - - 0.000 - - 0.011 - - 0.007 - - 0.000 - - 0.001 
ICC * L1 * mag - - 0.001 - - 0.005 - - 0.001 - - 0.000 - - 0.000 
ICC * L1 * strength - - 0.000 - - 0.011 - - 0.000 - - 0.000 - - 0.000 
ICC * mag * strength - - 0.000 - - 0.000 - - 0.006 - - 0.002 - - 0.000 
L2 * L1 * mag - - 0.001 - - 0.007 - - 0.004 - - 0.001 - - 0.001 
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估计 偏差 标准 误 比例 均 方 误差 95% CI 覆盖 率 SEPA 

sm ML BD INF ML BD INF ML BD INF ML BD INF ML BD INF 
L2 * L1 * strength - - 0.000 - - 0.024 - - 0.000 - - 0.000 - - 0.000 
L2 * mag * strength - - 0.014 - - 0.027 - - 0.005 - - 0.002 - - 0.007 
L1 * mag * strength - - 0.001 - - 0.001 - - 0.000 - - 0.001 - - 0.001 
ICC * L2 * L1 * mag - - 0.000 - - 0.010 - - 0.000 - - 0.000 - - 0.000 
ICC * L2 * L1 * strength - - 0.000 - - 0.009 - - 0.000 - - 0.000 - - 0.000 
ICC * L2 * mag * strength - - 0.000 - - 0.001 - - 0.011 - - 0.001 - - 0.000 
ICC * L1 * mag * strength - - 0.000 - - 0.001 - - 0.000 - - 0.000 - - 0.000 
L2 * L1 * mag * strength - - 0.000 - - 0.001 - - 0.000 - - 0.000 - - 0.000 
ICC * L2 * L1 * mag * strength - - 0.000 - - 0.001 - - 0.000 - - 0.000 - - 0.000 


YE: OML 为 极 大 似 然 估计 ; BD 为 无 信息 先 验 的 贝 叶 斯 估计 ， INF 为 有 信息 先 验 的 贝 叶 斯 估计 。C@ICC 为 组 内 相关 系数 ; L1 和 L2 分 别 表示 水 习 
表示 先 验 分 布 的 方差 大 小 。@ 加 粗 表 示 中 等 程度 以 上 的 效应 量 ， 即 partial n? 大 村 


F 0.06. 
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EE 1 和 水 平 2 样本 量 ; mag 表示 先 验 分 布 均值 偏 移 真 值 的 程度 ; 
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02 


ik: CORB 为 相对 偏差 BD 为 无 信息 先 验 的 贝 叶 斯 估计 ; L3 为 先 验 分 布 均值 向 左 偏离 真 值 3 个 标准 差 ; L1 向 左 偏离 真 值 1 个 标准 差 ' C 表示 提供 了 


时 ІСС-0.05 -€ ICC=01 -A- ІСС-02 


4 相对 偏差 结果 示例 


E 确 先 验 信息 ; R1 向 右 偏离 真 值 1 个 标准 差 ; R3 向 右 偏离 真 值 3 个 


色 虚 线 表示 相对 偏差 恰好 为 0 的 参照 ， 上 下 两 条 红色 


标准 差 。W 表示 先 验 信息 分 布 的 方差 较 大 ( 真 值 的 50%)，M 表示 先 验 信息 分 布 的 方差 中 等 ( 真 值 的 20%)，S 表示 先 验 信息 分 布 的 方差 较 小 ( 真 值 的 10%)。@@ 图 中 绿 


点 划 线 对 应 的 纵 4 


标 分 别 为 -10 和 10， 表 示 可 接受 的 相对 偏差 的 范围 
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SE SD for b01 
11-60 


11-150 


ik: OSE_SD 为 标准 误 比 例 ; BD 为 无 信息 先 验 的 贝 叶 斯 估计 ，L3 为 先 验 分 布 均值 向 左 偏离 真 值 3 个 标准 差 ; L1 向 左 偏离 真 值 1 个 标准 差 ，C 表示 提供 


量 - ICC =0.05 -€ ICC=0.1 -А- ІСС-02 


图 5 标准 误 比 例 结果 示例 


两 条 红色 点 划 线 对 应 的 纵 匀 


标 分 别 为 0.9 和 1.1， 表 示 可 接受 的 标准 误 比 例 的 范 
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E 确 先 验 信息 ; RI 向 右 偏离 真 值 1 个 标准 差 ，R3 向 右 偏离 真 
值 3 个 标准 差 。W 表示 先 验 信息 分 布 的 方差 较 大 ( 真 值 的 50%), М 表示 先 验 信息 分 布 的 方差 中 等 ( 真 值 的 20%)，S 表示 先 验 信息 分 布 的 方差 较 小 ( 真 值 的 10%)。@@ 图 中 绿 


色 虚 线 表 示 标 准 误 比 例 恰好 为 1 的 参照 ， 上 下 
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6 均 方 误差 结果 示例 


Hk: MSE 为 均 方 误差 ，BD 为 无 信息 先 验 的 贝 叶 斯 估计 ; L3 为 先 验 分 布 均值 向 左 偏离 真 值 3 个 标准 差 ，L1 向 左 偏离 真 值 1 个 标准 差 ，C 表示 提供 正确 先 验 信息 ; RI 向 右 偏离 真 值 1 个 标准 差 ，R3 向 右 偏离 真 值 3 个 
标准 差 。W 表示 先 验 信息 分 布 的 方差 较 大 ( 真 值 的 50%), M 表示 先 验 信息 分 布 的 方差 中 等 ( 真 值 的 20%)，S 表示 先 验 信息 分 布 的 方差 较 小 ( 真 值 的 10%)。 
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ik: OBD 为 无 信息 先 验 的 贝 叶 斯 估计 ; L3 为 先 验 分 布 均值 向 左 偏离 真 值 3 个 标准 差 ; L1 向 左 偏离 真 值 1 个 标准 差 ， C 表示 提供 
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图 7 95% СІ 履 盖 率 结果 示例 
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09 = 21 


E 确 先 验 信息 ; RI 向 右 偏 离 真 值 1 个 标准 差 ， R3 向 右 偏离 真 值 3 个 标准 差 。W 表示 


先 验 信息 分 布 的 方差 较 大 ( 真 值 的 50%)，M 表示 先 验 信息 分 布 的 方差 中 等 ( 真 值 的 20%)，S 表示 先 验 信息 分 布 的 方差 较 小 ( 真 值 的 10%). (©): 


为 0.9， 表 示 可 接受 的 95%CI Bt SAN eM 
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色 虚 线 表示 95% CI HKA 0.95 的 参照 ， 红 


色 点 划 线 对 应 的 纵 多 
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图 8 检验 力 结果 示例 


ik: BD 为 无 信息 先 验 的 贝 叶 斯 估计 ;IL3 为 先 验 分 布 均值 向 左 偏离 真 值 3 个 标准 差 ，L1 向 左 偏离 真 值 1 个 标准 差 ，C 表示 提供 正确 先 验 信息 ; RI 向 右 偏离 真 值 1 个 标准 差 ，R3 向 右 偏 离 真 值 3 个 标准 差 。W 表示 先 
验 信 息 分 布 的 方差 较 大 ( 真 值 的 50%), M 表示 先 验 信息 分 布 的 方差 中 等 ( 真 值 的 20%)，S 表示 先 验 信息 分 布 的 方差 较 小 ( 真 值 的 10%)。@ 红 色 点 划 线 对 应 的 纵 坐标 为 0.8， 表 示 可 接受 的 检验 力 的 最 小 值 。 
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4 讨论 
在 许多 心理 学 实验 (如 cRCT) 中 ， 由 于 数据 中 可 能 存在 的 嵌 套 结构 ， 研 究 者 常常 需要 建立 
多 层 模型 。 而 多 层 模型 往往 会 面临 样本 量 不 足 的 问题 , 从 而 为 研究 者 的 数据 分 析 造 成 较 大 的 阻 
碍 。 贝 叶 斯 估计 能 结合 一 定 的 先 验 信息 ,使 得 参数 的 估计 更 加 精准 , 但 先 验 分 布设 置 的 主观 性 
J 能 导致 错误 先 验 信息 的 出 现 。 本 文 基于 多 层 模型 ， 对 不 同样 本 量 和 组 内 相关 系数 条 件 下 ， 错 
误 先 验 信息 对 贝 叶 斯 估计 的 影响 进行 研究 ， 并 给 出 相应 的 Mplus 代码 ， 为 贝 叶 斯 估计 中 先 验 
分 布 的 设置 提出 一 定 的 建议 和 指导 。 当 ICC 较 大 、 水 平 1 及 水 平 2 样本 量 较 小 时 ， 错 误 先 验 
信息 对 参数 估计 带 来 较 大 的 偏差 。 先 验 分 布 的 信息 强度 越 强 , 其 错误 先 验 信息 对 参数 估计 的 影 
响 也 越 大 。 因 此 ， 在 样本 量 较 小 以 及 ICC 较 大 的 情况 下 ， 需 要 更 加 警惕 错误 先 验 信息 带 来 的 
影响 ， 更 谨慎 对 待 先 验 分 布 的 设置 。 
在 模拟 研究 中 ， 水 平 1 及 水 平 2 样本 量 越 大 ， 错 误 先 验 信息 对 参数 估计 带 来 的 风险 也 越 
低 ， 这 与 Holtmann 等 人 (2016) 的 结果 相 一 致 。 贝 叶 斯 方法 认为 未 知 参数 是 随机 变量 ， 可 以 利 
用 先 验 信息 和 似 然 函数 得 到 的 后 验 分 布 来 反映 参数 在 不 同 取 值 上 的 可 能 性 。 样本 量 较 小 时 , 先 
验 分 布 对 后 验 分 布 存在 较 大 的 影响 ,但 随 着 样本 量 的 增 大 ， 先 验 分 布 的 影响 逐渐 减弱 ， 后 验 分 
布 的 形态 逼近 似 然 函数 (Lynch, 2007)。 因 此 ， 当 样本 量 较 小 时 ， 先 验 分 布 的 错误 设置 往往 
来 更 严重 的 后 果 ， 需 要 更 加 谨慎 。 

对 于 cRCT 研究 中 一 般 最 受 关注 的 效应 bo1，ICC 较 大 时 ， 错 误 先 验 信息 对 参数 估计 带 来 
的 负面 影响 较 大 。 这 与 前 人 研究 是 一 致 的 ， 即 在 多 层 模 型 中 , 随 着 ICC 的 增 大 ,对 于 水 平 2 效 
应 的 估计 偏差 随 之 增 大 ， 检 验 力 随 之 减 小 (Cao et al., 2019; Finch & French, 2011)。 然 而 需要 注 
意 的 是 , 对 于 模型 中 的 其 他 回归 系数 , ICC 对 其 估计 偏差 及 检验 力 等 方面 的 影响 可 能 呈现 出 不 
一 致 的 规律 。 这 与 Cao 等 人 (2019) 的 研究 结果 同样 是 一 致 的 ， 即 对 于 纯粹 的 组 内 水 平 的 效应 ， 
以 及 组 间 和 组 内 变量 的 交互 效应 , ICC 对 于 其 参数 估计 、 检 验 力 等 方面 的 影响 均 没 有 达到 显著 。 
未 来 还 需要 通过 进一步 研究 来 更 深入 地 探讨 在 多 层 模型 中 ， 不 同 水 平 的 效应 在 不 同 ICC 水 平 
下 的 表现 ， 以 及 错误 先 验 信息 对 其 参数 估计 的 影响 。 

从 不 同 先 验 分 布设 置 的 贝 叶 斯 估计 结果 可 以 看 出 , 先 验 分 布 的 方差 较 大 时 , 其 错误 信息 带 
来 的 影响 较 弱 。 即使 先 验 信息 的 设置 对 真实 值 产生 一 定 的 偏离 , 这 种 偏离 带 来 的 负面 影响 可 以 
得 到 较 好 的 抑制 , 而 且 随 着 样本 量 的 增 大 ,抑制 的 作用 更 明显 。 但 当先 验 分 布 的 方差 较 小 时 ， 
即使 较 大 的 样本 量 也 难以 使 得 其 错误 先 验 信息 的 影响 得 到 降低 。 因 此, 对 参数 设置 方差 相对 较 
大 的 先 验 分 布 是 更 加 保险 的 。 
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标准 误 比 例 方面 的 表现 与 前 人 研究 也 大 致 一 致 。 随 着 先 验 分 布 方差 的 减 小 , 标准 误 比例 逐 
渐 增 大 。 这 表明 有 信息 先 验 的 贝 叶 斯 方法 的 后 验 分 布 标准 差 (Posterior SDs) 倾 向 于 高 估 参 数 估 
计 实 际 的 标准 差 (Empirical SDs)。 但 这 也 可 能 是 因为 随 着 先 验 分 布 方差 的 减 小 ， 参 数 估计 的 标 
准 差 也 逐渐 减 小 ， 从 而 导致 标准 误 比 例 的 增 大 (Holtmann et al., 2016)。 特 别 是 在 设 有 错误 先 验 
信息 的 情况 下 ， 贝 叶 斯 估计 更 倾向 于 高 估 标 准 误 。 因 此， 在 贝 叶 斯 估计 中 ,研究 者 往往 需要 通 
过 可 信和 区间 来 判断 参数 的 显著 性 。 
5 局 限 性 与 展望 
由 于 模拟 研究 无 法 穷尽 所 有 的 条 件 组 合 , 本 研究 主要 关注 在 cRCT 的 研究 中 最 常见 的 样本 
量 范围 。 然 而 ,在 实际 研究 中 ,可 能 出 现 其 他 样本 量 组 合 的 情况 。 而 且 ， 本 研究 只 考虑 了 不 同 


群 组 内 部 样本 量 相等 的 情况 , 但 实际 研究 中 不 同 群 组 内 的 样本 量 往往 很 难 达到 平衡 。 未 来 可 以 
2 进一步 研究 这 种 样本 量 不 平衡 的 情况 下 ,错误 先 验 信息 是 否 会 带 来 更 大 的 负面 影响 。 另 外 ,本 
= 研究 在 水 平 1 样本 量 的 设置 上 跨度 较 大 ,未 来 研究 中 可 以 在 样本 量 方面 进行 更 加 精细 的 设置 。 
= 为 了 简化 模拟 研究 的 条 件 ， 本 文 假设 因 变 量 服从 连续 正 态 分 布 。 然 而 ， 在 实证 研究 中 ,这 
о 假设 常常 会 被 违背 ,例如 , 由 于 研究 者 主观 上 有 意 或 无 意 的 选择 倾向 , 或 者 由 于 天 花 板 效应 、 
地 板 效应 的 存在 , 变量 数据 很 可 能 存在 一 定 程度 的 偏 态 (Fleishman, 1978). 另外, 在 cRCT 中 ， 
ed 可 能 出 现 结果 变量 为 分 类 变量 , 特别 是 二 分 的 变量 的 情况 (Legare etal., 2015)。 因 此 ， 未 来 研究 
> 可 以 进一步 探讨 因 变量 为 不 同 数据 类 型 的 情况 下 ， 错 误 先 验 信息 可 能 带 来 的 影响 。 


另外 ， 考 虑 到 CRCT 研究 中 一 般 最 受 关注 的 是 实验 干预 对 因 变量 产生 的 效应 bo1， 本 文 主 
= 要 关注 的 也 是 poi 受 到 不 同 数据 条 件 及 因素 的 影响 。 然 而 , 对 于 模型 中 的 其 他 回归 系数 , ICC 对 
Oo 其 估计 偏差 及 检验 力 等 方面 的 影响 可 能 呈现 出 不 一 致 的 规律 ， 未 来 需要 对 多 层 模 型 中 不 同 水 
平 效应 参数 受到 的 来 自 错 误 先 验 信息 的 影响 进行 更 深入 的 探究 。 


6 研究 结论 
本 文 聚焦 于 多 层 线性 模型 中 不 同 信息 强度 和 偏差 程度 的 先 验 信息 对 贝 叶 斯 估计 的 影响 ， 
行 一 系列 蒙特 卡 洛 模拟 , 讨论 了 cRCT 背景 下 的 多 层 线性 模型 中 不 同样 本 量 、ICC 和 数 
型 下 错误 先 验 信息 对 参数 估计 带 来 的 影响 ， 希 望 为 贝 叶 斯 估计 中 先 验 分 布 的 设置 提供 一 
定 的 理论 补充 及 实证 参考 。 本 文 得 出 的 结论 如 下 : 

(1) 在 小 样本 的 多 层 模型 中 ，ML 和 无 信息 先 验 的 贝 叶 斯 估计 可 能 导致 有 偏 的 组 间 参 数 估 
计 ， 因 此 在 样本 量 较 小 的 情况 下 建议 尽 可 能 对 贝 叶 斯 方法 设 定 一 定 的 先 验 信息 。 

O) 严 重 错误 的 先 验 分 布 可 能 对 贝 叶 斯 参数 估计 带 来 毁灭 性 的 结果 ， 从 而 为 实证 研究 带 来 
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一 定 的 风险 。 在 先 验 分 布 均值 偏离 真 值 程度 较 小 (不 超过 1 个 标准 差 ) 的 情况 下 ， 贝 叶 斯 估计 的 
总 体 表现 大 体 可 以 被 接受 。 

(3) 当 水 平 2 样本 量 及 先 验 分 布 方差 较 小 时 ， 错 误 先 验 信息 的 设置 会 对 参数 估计 带 来 较 大 
的 偏差 。 对 于 cRCT 研究 中 一 般 最 受 关 注 的 干预 效应 bo1，ICC 的 增 大 也 会 较 大 程度 上 增 大 错 
误 先 验 信息 的 负面 影响 。 因 此 ， 在 这 些 情 况 下 需要 更 加 警惕 错误 先 验 信息 带 来 的 风险 。 

(4) 在 现 有 先 验 信息 不 足 、 错 误 先 验 信息 风险 较 大 的 情况 下 ， 实 证 研究 者 可 以 通过 尽 可 能 
增 大 群 组 样本 量 ， 并 适当 增加 先 验 分 布 的 方差 来 降低 错误 先 验 信息 可 能 带 来 的 影响 。 
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Mise: 贝 叶 斯 多 层 模 型 Mplus 语句 


TITLE: This is an example of Bayesian Multilevel Modeling 


DATA: 
FILE =data ef-nor-0.05-20-30 1.dat; 


VARIABLE: 
NAMES = GroupID MemID wlj x1 x2 x3 Y; 
USEVAR = GroupID w1j x1 x2 x3 Y; 
CLUSTER - GroupID; 
WITHIN = x1 x2 x3; 
BETWEEN = wlj; 


ANALYSIS: 
TYPE IS TWOLEVEL RANDOM; 
ESTIMATOR = BAYES; 
PROCESSORS = 2; 
BITERATIONS = 70000 (2000); 


MODEL: 
%WITHIN% 
Y; 
blj | YON xl; 
b2j | Y ON x2; 
b3j | Y ON x3; 


%BETWEEN% 

Y blj b2j b3j; 
[Y]; 

(6171 (b10); 

[b2j] (620); 

(53/1 (b30); 

Y ON wlj (b01); 
blj ON wlj (b11); 
b2j ON w1j (b21); 
b3j ON wlj (31); 
Y; 

blj-b3j; 


MODEL PRIORS: 
b01-N(1.5,0.75); 
b11-N(0.12,0.06); 
b21-N(-0.05,0.025); 
b31-N(-0.75,0.375); 
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b10-N(2.3,1.15); 
b20~N(-0.25,0.125); 
b30~N(-0.75,0.375); 


OUTPUT: 
ТЕСНІ TECH8 CINT; 
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